热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MPEG-7标准概述作者:张继东

MPEG-7标准概述作者:张继东发布时间:20010606
MPEG-7标准概述     作者:张继东    发布时间:2001/06/06
 
文章摘要:
  摘要:针对现有的国际标准中还没有能够解决多媒体信息定位问题的工具,活动图象专家组决定发展一个新的国际标准──MPEG-7。本文就MPEG-7做全面的介绍。
  关键词:MPEG-7 视频 多媒体 信息定位
 
MPEG-7标准概述


一.MPEG-7产生的背景
  在活动图象专家组(Moving Picture Experts Group, MPEG)已经制定的国际标准中,MPEG-1用来解决声音图象信息在CD-ROM上的存储,MPEG-2解决了数字电视、高清晰度电视及其伴音的压缩编码。1993年提出的MPEG-4用以解决在多媒体环境下高效存储、传输和处理声音图象信息问题,在1998年11月形成最终的正式国际标准。但在现有的国际标准中还没有能够解决多媒体信息定位问题的工具。活动图象专家组的成员们认识到这一现状和实际的需求,决定在这一应用领域发展一个新的国际标准──MPEG-7,旨在解决对多媒体信息描述的标准问题,并将该描述与所描述的内容相联系,以实现快速有效的搜索。只有首先解决了多媒体信息的规范化描述之后,才能更好地实现信息定位。该标准不包括对描述特征的自动提取。它的正式名称是"多媒体内容描述接口(Multimedia Content Description Interface)"。MPEG-7标准可以独立于其它MPEG标准使用,但MPEG-4中所定义的音频、视频对象的描述适用于MPEG-7。MPEG-7的适用范围广泛,既可应用于存储(在线或离线),也可以用于流式应用(如广播、将模型加入互联网等)。它还可在实时或非实时的环境下应用,实时环境指的是当信息被捕获时是与所描述的内容相联系的。
二 MPEG-7的目标和对象
  MPEG-7标准的目的是要制定一种针对各类多媒体信息的描述标准。该描述与内容有关,并能够达到快速高效地搜索用户感兴趣的素材。
  无论描述的形式如何,描述都可以附在任何一种多媒体素材之后。具有此种附加信息的存储素材就可以被方便地索引和搜索了。尽管MPEG-7描述与被描述内容的表达方式无关,但在一定程度上还是依赖于MPEG-4标准,在该标准中提供了一种将声音图象内容作为在时间(同步)和空间(屏幕)上有一定联系的对象来编码的方法。
对不同类型、不同应用的多媒体信息的标准化描述可以在若干个不同的语义层上进行。比如以视频内容为例:低抽象的语义层可以是对场景中物体的形状、大小、纹理、色彩和位置的描述。而最高抽象的语义层则以高效编码的形式给出语义信息,如:'这是一个位于左侧的棕色狗和一个在右侧并下落着的篮色球的场景'。也可以有中间层存在。不同的应用决定了相同的内容可以有不同的描述,对不同类型的信息描述也不相同。
  对MPEG-7而言,需要描述的各种多媒体信息素材包括:静止图片、图形、声音、运动图象,以及有关这些元素如何组合成多媒体表述的组合信息。换而言之,MPEG-7定义的"多媒体"含义十分广泛,包括:
  1. 客观类:图像、图表、文本、三维模型、音频、语音、视频等。
  2. 主观类:对对象/事件的概括、人的感性色彩等。
  3. 合成类:各种元素之间的有机结合以构成一个真正意义上的多媒体演示。如人的面部表情、性格特征、以至一段电影的主题都是MPEG-7中的数据类型之一。
  为此,MPEG-7定义了"标准描述子集合(Standard Set of Descriptors)"用于描述各种类型的多媒体数据,与之相应的"描述方案( Description Schemes)"用于规范多媒体描述子的生成和不同描述子之间的有机联系。这些描述子与所指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容的语义的准确检索提供了接口。在此基础上,MPEG-7定义了一种新的语言-"描述定义语言(Description Definition Language)"用于指定和生成描述方案。
  和VHDL语言在超大规模集成电路应用中所扮演的角色一样,DDL语言是MPEG-7 的核心。图1解释了描述定义语言、描述方案和描述子的关系。从功能的角度来看,DDL提供了DS/D建立的机制,DS/D则构成了多媒体描述生成的基础。
  要充分地利用多媒体信息描述,特征(或'描述子')的自动提取是十分有用的。但是根据MPEG一贯坚持的"制定最少的、最有用的"原则,MPEG-7主要集中在对便于多媒体信息分
类的表达方法进行标准化。而特征提取算法、声音图象内容识别工具不属于MPEG-7标准的界定范围。同样搜索机制和音频或视频回放技术也不包括在MPEG-7标准中,而只确定描述与搜索机制之间的接口,见下图说明。开发声音图象内容识别工具、特征抽取工具、搜索和音频视频回放工具是工业界的任务,他们会生产销售符合MPEG-7的产品。而在标准发展过程中,正如MPEG-1,-2和-4那样,活动图象专家组会建立一些编码工具(如MPEG-2的Test Model, MPEG-4的Verification Model等),但这些编码工具只作研究之用,并不作为标准。

图1描述定义语言、描述方案和描述子的关系


  符合MPEG-7标准的描述可以是手工输入的,也可以是自动提取的,标准中对此并不作规定。但某些特征最好自动提取(如色彩、纹理),但另一些特征(如:这一场景包括三双鞋,那段音乐录于1995年等)则很难甚至不可能自动提取,所以要根据描述的内容和层次来决定。
  MPEG-7可以独立于其它MPEG标准使用,例如符合MPEG-7标准的描述甚至可以附在非数字模拟影片之后。但是MPEG-7标准也利用了MPEG-4标准提供的用对象来描述声音图象数据的方法,这一表达方法是多媒体信息分类过程的基础。同时,MPEG-7描述又可以帮助改进以往MPEG标准编码的性能。所以各MPEG标准是即相互独立又相互联系的。
三 MPEG-7标准的特点
  MPEG-7 标准的目的是要规定一个描述各种多媒体信息的描述子的标准集和定义其它的描述子和用于描述子结构和关系的描述方案的标准方式。更重要的是,考虑到面向用户,描述子和描述方案是基于内容。
在MPEG-7标准中,最具特点的相关应用方案是:交换处理,多媒体内容的个性化窗口和分配处理。
  1. 内容交换:一个可互操作的内容描述标准使得来自不同视频音频数据库的多媒体内容交换成为可能。MPEG-7将提供各种方法用来表达,翻译,交换和重新利用不同来源的视频音频资料。因为MPEG-7提出采用一种单一的可交互操作的交换格式,这样交换格式独立于任何系统和信息提供商(厂家)。这样多媒体内容描述的互换就可以实现。
  2. 个性化窗口:MPEG-7标准提供的检索和交换视频音频数据的结构和语义注解能力,使得使用者在用户端能设定显示而无须要求从内容广播商那儿再次将其以不同格式下载一遍。
  3. 分配处理:独立于任何系统,应用,厂商,MPEG-7将保证视频音频资料描述的交换能力。因此,服从于此标准的,来源不同的数据能适用各种各样的应用,诸如:多媒体检索系统和处理器,筛选系统等等。

四 MPEG-7标准的应用
  MPEG-7标准的应用领域十分广泛,包括:

  • o 数字图书馆(图象目录,音乐字典…)
    o 多媒体目录服务(例如黄页号薄…)
    o 广播媒体选择(无线电频道,TV频道…)
    o 多媒体编辑(个人电子新闻服务,媒体写作)
    o 在教育,娱乐(例如查找游戏,KARAOKE) ,医疗应用,地理信息系统,等领域都有潜在的应用价值。见图 2所示:


图2 MPEG-7在多媒体信息查询中的作用


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Redis底层数据结构之压缩列表的介绍及实现原理
    本文介绍了Redis底层数据结构之压缩列表的概念、实现原理以及使用场景。压缩列表是Redis为了节约内存而开发的一种顺序数据结构,由特殊编码的连续内存块组成。文章详细解释了压缩列表的构成和各个属性的含义,以及如何通过指针来计算表尾节点的地址。压缩列表适用于列表键和哈希键中只包含少量小整数值和短字符串的情况。通过使用压缩列表,可以有效减少内存占用,提升Redis的性能。 ... [详细]
  • 本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量,或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频,只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量,只有使用JAVA编写Android客户端才能实现压缩。此外,作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因,并提供了解决方法。最后,作者还介绍了一个用于处理图片的类,可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]
  • 突破MIUI14限制,自定义胶囊图标、大图标样式,支持任意APP
    本文介绍了如何突破MIUI14的限制,实现自定义胶囊图标和大图标样式,并支持任意APP。需要一定的动手能力和主题设计师账号权限或者会主题pojie。详细步骤包括应用包名获取、素材制作和封包获取等。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 本文介绍了在Python中使用zlib模块进行字符串的压缩与解压缩的方法,并探讨了其在内存优化方面的应用。通过压缩存储URL等长字符串,可以大大降低内存消耗,虽然处理时间会增加,但是整体效果显著。同时,给出了参考链接,供进一步学习和应用。 ... [详细]
author-avatar
清明如月_213
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有